1131260足球视频中的上下文感知损失函数0Anthony Cioppa*0列日大学[email protected] Deli`ege*0列日大学[email protected] Giancola*[email protected]沙特...
1131260足球视频中的上下文感知损失函数0Anthony Cioppa*0列日大学[email protected] Deli`ege*0列日大学[email protected] Giancola*[email protected]沙特...
⃝可在www.sciencedirect.com上在线获取ScienceDirectICTExpress 8(2022)65...接受日期:2021年3月10日2021年3月26日网上发售摘要从足球视频中提取知识有着巨大的应用,如基于上下文的广告,基于内
670大规模搜索与上下文感知网络传播与圈长分布细化周期长度优化上下文感知和尺度不敏感的时间重复计数张怀东1,徐学苗1,2,3,韩国强1,何胜峰11华南理工2亚热带建筑科学3计算智能与网络空间信息广东省重点实验室...
上下文感知学习基础,包括上下文的概念,上下文计算及应用,传感器技术,上下文信息模型,安全与个人隐私等。
面向实际应用的上下文感知推荐系统玛丽·古赛因引用此版本:玛丽·阿尔·戈森用于现实世界应用的上下文感知推荐系统人工智能.巴黎-萨克雷大学,2019年。英语NNT:2019SACLT008。电话:02275811HAL Id:tel-02275811...
⃝可在www.sciencedirect.com在线获取ScienceDirectICTExpress 8(2022)65...接受日期:2021年3月10日2021年3月26日网上发售摘要从足球视频中提取知识有着巨大的应用,如基于上下文的广告,基于内容
生成精确、细粒度的字幕不仅需要理解视频的全局内容,还需要捕捉对象的详细信息。同时,视频表示对生成的字幕的质量有很大的影响。因此,重要的是视频字幕捕捉显着的对象与他们的详细的时间动态,并表示他们使用有...
[email protected]摘要0时间动作定位的主要挑战是从未剪辑视频中检索出各种共现成分(例如上下文和背景)中微妙的人类动作。虽然先前的方法通过设计先进的动作检测器取得了实质性的进展,但它们仍然受到这些共现成分...
1使360°视频在2D中可观看:学习视频摄影点击免费观看德克萨斯大学奥斯汀分校摘要360°视频要求人类观看者在观看视频时主动控制看“哪里”。虽然它提供了视觉内容的更沉浸式体验,但它也为观看者带来了额外的负担;...
112用于视频域自适应的跨模态对比特征学习金东铉1,蔡怡萱2,庄冰冰2,向宇2斯坦·斯科拉罗夫1,凯特·萨彦科1,3,曼莫汉·钱德拉克21波士顿大学、2NEC Labs America、3MIT-IBM Watson AI Lab{donhk,sclaroff,...
现有的方法集中于在短视频中执行重复动作计数,这对于在更现实的场景中处理较长的视频是困难的。在数据驱动的时代,这种泛化能力的下降主要归因于缺乏长视频数据集。为了补充这一优势,我们引入了一个新的大规模重复
1任务驱动的动态融合:减少视频描述中的歧义Xishan Zhang12,Yongdong Zhang12,Yongdong Zhang 12,Dongming Zhang1,Jintao Li1,and Qi Tian31中国科学院计算技术研究所,中国北京2中国科学院大学,中国3德克萨斯...
我们的方法可以通过预测视频中混洗剪辑的顺序来学习视频的时空视频的类别是不需要的,这使得我们的技术有可能利用无限的未注释的视频。存在使用帧的相关工作,而与帧相比,剪辑更符合视频动态。剪辑可以帮助减少命令...
用于有效动作识别的动态层跳过钟贤善1黄在东2钟焕门3韩宝亨1首尔国立大学2麻省理工学院3Kakao Brain{sunutf,bhhan}@ [email protected]摘要分析视频内容的挑战之一(例如,动作)是高计算成本...
2398高分辨率视频帧内插的IM-NetTomer Peleg Pablo Szekely Doron Sabo Omry Sendik三星以色列研发中心{tomer.peleg,pablo.sz,doron.sabo,omry.sendik}@ samsung.com摘要视频帧内插是视频处理领域中一个研究已久...
我们提出了一个新的计算模型,在以自我为中心的视频的凝视预测,通过探索模式的时间转移的凝视固定(注意力转移),是依赖于以自我为中心的操纵任务。 我们的假设是,如何以某种方式完成任务的高层次的背景下有很强...
1用于集成2D和3D人体感知的深度多任务架构Alin-Ionut Popa2分,Mihai Zanfir2分,Cristian Sminchisescu1分,2分alin. imar.ro,mihai. imar.rocristian. math.lth.se1隆德大学2罗马尼亚科学院摘要我们提出了一个...
140530用于统一感知解析的深度分组模型0李志恒 1 鲍文轩 2 * 郑佳阳 1 徐晨亮 101 罗切斯特大学 2 清华大学0{ zhiheng.li,jiayang.zheng,chenliang.xu } @rochester.edu [email protected]....
156610基于负向感知的图像-文本匹配框架0张坤1,郑东毛1*,王权2,张永东101 中国科学技术大学,中国合肥; 2 中国邮电大学,可信分布式计算与服务教育部重点实验室,中国北京[email protected],{zdmao,...
一种改进的有监督视频摘要艾迪安·沙尔吉1[000000320051334]、阿里·博尔吉1、李...自动总结视频已经成为浏览、搜索和索引视觉内容的实质性需要。本文是在静脉的监督视频摘要使用顺序决定点过程(SeqDPPs),模型的多
为了以数据驱动的方式实现这个目标,人们可能经常面临这样的情况,其中在实践中使用的目标视频类别上没有可用的高光注释,而对另一个视频类别(称为源视频类别)的监督是可实现的。 在这种情况下,可以通过将从源...
Journalof King Saud University沙特国王大学沙特国王大学学报...接受日期:2016年2016年8月2日在线发布摘要运动估计和补偿在视频压缩中起着重要的作用,可以减少输入视频的时间冗余。各种块搜索模式已被开发用
4997基于弱监督多尺度属性特定定位唐楚峰1卢胜2张兆祥3胡小林11智能技术与系统国家重点实验室,清华大学北京国家信息科学技术研究中心计算机科学与技术系人工智能研究所2北京航空航天大学软件学院3中国科学{tcf18@...
10473SEEG:语义赋能的协同语音手势生成梁远志*1、2、冯倩玉3、朱林超2、李虎1、潘攀1、杨毅31阿里巴巴集团达摩院2ReLER Lab,AAII,悉尼科技大学3浙江大学...目前的研究主要集中在手势与语音节奏的匹配上,这使得手势
具有收缩损失的Xiankai Lu1,3, Chao Ma2,Bingbing Ni1,4,Xiaokang Yang1,4,Ian Reid2,and Ming-HsuanYang5,61上海交通大学2阿德莱德大学3Inception人工智能4SJTU-UCLA机器感知与推理联合中心5加州大学默塞...
普卢默马修布朗<$斯维特拉娜Lazebnik伊利诺伊大学香槟分校(University of Illinois at Urbana Champaign)@ www. [email protected]摘要本文讨论了视频摘要,或将原始视频提取为较短形式,同时仍...
4010学习Siamese跟踪器的模型更新Lichao Zhang1,Abel Gonzalez-Garcia1,Joost van de Weijer1,Martin Danelljan2,Fahad ShahbazKhan3,41西班牙... liu.se摘要Siamese方法通过从当前帧中提取外观模板来定位下
3288一种用于三维动作识别的骨架序列表示方法柯秋红1,穆罕默德·本那蒙1,安森健1,费道斯·索赫尔2,法里德·布赛义德11西澳大利亚大学2默多克大学qiuhong.ke邮件research.uwa.edu.au{mohammed.bennamoun,senjian...
文中首先概述了大模型技术的发展历程,自动驾驶模型的迭代路径,以及大模型在自动驾驶行业中的作用。接着,详细介绍了大模型的基本定义、基础功能和关键技术,特别是Transformer注意力机制。文章还探讨了大模型在...
深度神经网络(DNNs)是一个由多个层组成的递归函数,每一层由多个神经元组成,每个神经元接收前一层所有神经元的输出,根据输入数据对输出进行计算并传递给下一层神经元,最终完成预测或分类任务。DNNs的学习能力强...